REPRESENTACIÓN DEL
CONOCIMIENTO

“El conocimiento es el lenguaje que nombra y describe” (Wittgenstein)

“La ciencia es conocimiento organizado” (Herbert Spencer)

“El conocimiento es lingüístico” (Peirce)



La Escala “Dato – Información – Conocimiento”

La triada “Dato - Información - Conocimiento” constituye una escala de semántica creciente, desde lo superficial a lo profundo, desde la forma al fondo. Dado que la semántica es inexpresable, existe una cierta frontera difusa entre estos tres conceptos. No obstante, podemos señalar las características principales de cada uno de ellos:


Dato

En general, un dato es un valor aislado o es el valor de un atributo o predicado de una cierta entidad desconocida. El valor puede ser cuantitativo o cualitativo, con o sin unidad (en el caso de valor numérico). Por ejemplo: el dato “33” no sabemos si se trata de la edad de alguien, de una temperatura, una longitud, una velocidad, etc.; el dato “azul” no sabemos si es el color de algo, un ejemplo de palabra de 4 letras, etc. Y si conocemos el valor numérico y la unidad (es decir, tenemos una magnitud), no sabemos a qué entidad corresponde. Por ejemplo, 1, 80 metros puede ser la altura de una persona, el ancho de un armario, etc.


Información

Una información es un dato (o conjunto de datos) con contexto, con referencia, asociado a una entidad concreta. Información = dato + interpretación. Por ejemplo: “Pepe tiene 33 años”, “la temperatura en esta habitación es de 33 grados”, “mi velocidad es de 33 Kms/hora”, etc.


Conocimiento

El conocimiento corresponde a lo más alto de la escala semántica. Como la semántica no se puede definir, tampoco se puede definir lo que es el conocimiento. Ocurre lo mismo que con la conciencia, la verdad y la vida.

Podemos decir que el conocimiento es la interpretación subjetiva de la información. El conocimiento es una información (o conjunto de informaciones) con significado, que se interioriza, interpreta o evalúa de forma subjetiva dentro de un contexto. Cuando el conocimiento se hace explícito, se convierte en un conjunto de informaciones interrelacionadas.


La representación del conocimiento

La representación del conocimiento se utiliza principalmente en los llamados “sistemas expertos”. Un sistema experto es un sistema que recoge el conocimiento de un experto (o conjunto de expertos) en un dominio determinado. Suelen estar basados en reglas.

Algunos ejemplos de sistemas expertos son: Dendral (el primer sistema experto para ayuda en la identificación de estructuras moleculares de sustancias desconocidas), Macsyma (manipulación simbólica de expresiones matemáticas), Mycin (diagnóstico y tratamiento de enfermedades de la sangre), Prospector (búsqueda de yacimientos geológicos), KRM (dinámica no-lineal), ARIS (recursos de información aeroportuaria), etc.


Conocimiento vs. Información

Hay muchos aspectos diferenciadores entre conocimiento e información.
Metadato, Metainformación y Metaconocimiento

Un metadato es un dato aplicado a un dato. Por ejemplo, en “azul oscuro”, “oscuro” es un dato aplicado al dato “azul”.

Una metainformación es una información aplicada a una información. Por ejemplo, en “33 frutas, 12 son manzanas”, “12 manzanas” es una metainformación de la información “33 frutas”. Y en “Juan tiene dos hijos”, una metainformación sería decir que sus hijos se llaman Elena e Iván.

Un metaconocimiento es un conocimiento que se refiere a otro conocimiento. Por ejemplo, puede referirse a la evaluación del conocimiento, cómo utilizar el conocimiento, su prioridad o peso, etc.


El Problema de la Representación del Conocimiento

En el área de la representación del conocimiento podemos distinguir los siguientes problremas:
Sistemas de Representación del Conocimiento

Existen numerosos sistemas de representación del conocimiento. Destacan los siguientes:

Marcos

Los marcos (frames), propuestos por Marvin Minsky en 1975 son el sistema de representación del conocimiento que han tenido históricamente mayor nivel de aceptación.

Sus características son las siguientes: Un objeto (en POO, programación orientada a objetos) es muy similar a un marco. Los objetos tienen propiedades, que son atributos y métodos internos. Un objeto puede compartir (heredar) propiedades (atributos y métodos) de los objetos de un nivel superior. Los objetos se comunican mediante mensajes. Cada mensaje hace reaccionar al objeto, a nivel interno, externo o ambos. Análogamente, los marcos tienen asociados propiedades, que son los atributos (slots), los procedimientos y las reglas.

Desde la formulación teórica de Minsky, se han realizado diversas implementaciones de los marcos, como KL-ONE, KRL, OWL y CLASSICS. KL-ONE es el más relevante. CLASSICS es un descendiente de KL-ONE.

Minsky admitía que los marcos no constituyen una teoría completa, pero que los marcos pueden explicar muchas características de la conciencia humana. Por ejemplo, que la inteligencia consiste en seleccionar en cada nueva situación el marco general más adecuado y adaptarlo cambiando los detalles. Y que el aprendizaje consiste en la construcción de nuevos marcos.


Redes semánticas

Una red semántica es un conjunto de nodos y arcos. Cada nodo representa una entidad, que puede ser una acción, un atributo, un evento, una estructura, una clase, un marco, etc. Un arco es una relación entre dos nodos (entidades). Hay muchos tipos de relaciones, entre las que están: Una red semántica es diferente de un grafo. Un grafo es una estructura de datos. Una red semántica es un sistema de representación del conocimiento. Por lo tanto, una red semántica tiene mayor nivel semántico que un grafo.

En una red semántica, la red puede ser jerárquica (una jerarquía taxonómica) o relacional. En la jerárquica hay un nodo superior (top) al que se le asigna uno o varios nodos hijos, que a su vez tienen otros nodos hijos y así sucesivamente hasta que se alcanza el final (bottom), cuyos nodos pueden ser o bien entidades o bien instancias de entidades.

El concepto de herencia es fundamental en las redes semánticas jerárquicas. Las propiedades de un nodo se basan en las propiedades de los nodos superiores de la jerarquía.

El tipo de red semántica más corriente es el de red IS-A. De hecho, muchas veces se menciona este tipo como sinónimo de red semántica. Una red IS-A es una jerarquía taxonómica constituida por un sistema de enlaces de jerarquía y herencia entre los nodos. Las taxonomías clásicas naturales son un buen ejemplo: un perro es un cánido, un cánido es un mamífero, un mamífero es un animal.

Las redes semánticas IS-A son muy flexibles, pero los investigadores de IA han puesto de manifiesto algunos problemas y desventajas importantes, entre los que cabe destacar los siguientes:
Marcos vs. Redes semánticas

Existen coincidencias y diferencias entre las redes semánticas y los marcos: En general, la red basada en marcos es la que ha recibido más atención, tanto a nivel teórico (ciencia cognitiva y lingüística) como práctico, por su flexibilidad y sus posibilidades.


Ontologías

Una ontología es un conjunto de conceptos y de relaciones entre esos conceptos. Esas relaciones incluyen restricciones de consistencia del sistema. Por ejemplo, en el mundo de los bloques, los conceptos son “bloque” y “suelo”, y la relación “sobre”. Un bloque está sobre otro bloque o sobre el suelo. Un bloque no puede estar sobre sí mismo.

Actualmente, la representación del conocimiento se ha reorientado hacia el amplio dominio de las ontologías. La mayoría de los lenguajes de ontologías son de tipo declarativo, y están basados, en mayor o menor medida, en marcos o en la lógica de predicados de primer orden.

Los nuevos desarrollos de lenguajes y sistemas de representación del conocimiento con ontologías se han reorientado hacia la Web. Hacen uso de los estándares XML, XML Schema, RDF, RDF Schema, así como lenguajes de ontologías Web como Web Ontology Language.
Sistemas de producción

Un sistema de producción se basa en el paradigma de la programación lógica. Se compone de una base de hechos (conocimiento específico) y una base de reglas (conocimiento genérico) del tipo “condición → acción”.

Para inferir nuevos conocimientos mediante reglas hay dos mecanismos:
  1. Inferencia (o encadenamiento) hacia adelante (forward chaining). Es el modus ponens generalizado: a partir de hechos y reglas, se obtienen nuevos hechos, y a partir de de los hechos deducidos se obtienen nuevos hechos, y así sucesivamente hasta agotar todas las posibilidades de inferencia.

  2. Inferencia (o encadenamiento) hacia atrás (backward chaining). Es el proceso inverso al anterior. Va desde un posible hecho a su validación por las reglas existentes.
Ventajas: Las reglas son independientes entre sí, son simples y se actualizan fácilmente.

Inconvenientes: Se requieren muchas reglas, necesita un motor de inferencia, y no permite herencia ni compartición en general.

Prolog es el lenguaje de programación lógica más conocido.


MENTAL, un Lenguaje Universal para Representación del Conocimiento

MENTAL, como lenguaje de representación del conocimiento, resuelve la problemática planteada anteriormente:
Ejemplos

La relación IS-A (x es y) de las redes semánticas es una relación binaria tipo sujeto-predicado y se expresa simplemente como x/y, en donde x es el sujeto, e y es el predicado. Ejemplos: La relación HAVE-A (x tiene la propiedad y) de las redes semánticas es una relación ternaria de la forma x/(propiedad/y). Ejemplos:

Adenda

MENTAL, una lengua Tertium Comparationis para traducción

Tertium Comparationis” significa en latín “la tercera (parte) de la comparación”. Es la cualidad que dos cosas tienen en común al compararlas. MENTAL se puede utilizar como lengua intermedia para representar la estructura común entre diferentes lenguas, para el proceso de traducción (especialmente automática) de un texto en una lengua A en otra lengua B.

Normalmente la traducción de un texto de una lengua a otra se realiza desde el nivel superficial. Con MENTAL se pasa el texto de la lengua A a un nivel profundo (el código MENTAL), para luego “emerger” en otra lengua B. El nivel profundo de MENTAL, junto con su flexibilidad y poder, es el que mejor puede reflejar y representar el conocimiento asociado a un texto.


Bibliografía